为什么你的简历里能力写的越多越牛,被Pass的机会就越大?全是余弦定理搞的怪!
大家好,我是科学羊🐑,这里是数学专栏第3季第10篇。
从上一讲我们学习到,在探索协作和前行的秘密时,我们发现一个关键因素:力量的方向必须一致。
这不仅适用于物理世界,也是在追求目标时避免偏离的重要原则。
这里,我们将探讨如何利用向量之间的角度计算来理解这一现象,核心工具就是余弦定理。
虽然余弦定理在中学课本中曾是我们的知识点,但可以说,多数人可能早已将其忘记,毕竟,它在日常生活中的应用似乎并不常见。
这种遗忘并非完全是我们的过错,因为在学校里,余弦定理的教学重点通常局限于计算已知两边的三角形中第三边的长度,这在日常生活中的实用性不大。
教科书往往忽略了余弦定理在其他领域的应用。
01 重新认识余弦定理
我们先回到中学课本!
什么是余弦定理?
余弦定理是三角形中三边长度与一个角的余弦值(cos)的数学式,参考上图,余弦定理指的是:
同样,也可以将其改为:
其中c是γ角的对边,而a和b是γ角的邻边。
当知道三角形的两边和一角时,余弦定理可以用求第三边的L,或是当知道三边的L时,可用来求出任何一个角。
好,回到正题。
今天,让我们从毕达哥拉斯定理出发,重新审视余弦定理,探索它在解决实际问题中的价值。
我们初中就知道,在毕达哥拉斯定理中(勾股定理):直角三角形中,两直角边L的平方和等于斜边的平方。
这个定理为我们提供了理解角度与边长关系的基础,即!
但是,如果我们进一步思考,当两边夹角为锐角(小于90度)时,斜边的平方与两直角边的平方和相比如何?
反之,如果是钝角(大于90度)呢?通过简单的图解,我们可以直观地看到,夹角的性质(锐角、直角、钝角)会影响斜边长度的比较结果。
如图,
如果a和b的夹角>90度,蓝色的部分,所对应的斜边比较长,c²超过了a²+b²。
如果不到90度,红色部分,那么就比较短,c²<a²+b²。
其实我们可以从c²,以及a²+b²,反推就可以知道夹角是怎样的。
具体的判别如下:判定因子小于0为钝角,等于0为直角,大于0为锐角。
为了便于判断夹角的性质,我们将毕达哥拉斯定理转化为一个新的形式,并引入一个判定因子Δ。
通过比较Δ与零的关系,我们可以判定夹角的类型。
将这一概念进一步抽象化,我们发现Δ实际上是边长的函数,这为我们消除边长影响、仅通过角度进行判断提供了方法。
通过对Δ进行处理,我们得到了一个与角度的余弦值直接相关的量,这就是余弦定理的精髓所在。
算出两个向量的夹角有什么用?
其实有很多的应用,比如可以对文本进行自动分类。这两件事情看似不相干,怎么会联系到一起呢?
02 实际应用
下面我们就大致介绍一下计算机进行文本自动分类的原理。
以金融和计算机两个领域为例,虽然它们的讨论主题相去甚远,但通过细致观察,我们会发现讨论金融的文章中频繁出现如“金融”、“股票”、“交易”、“经济”等专业术语,而计算机领域的文章则倾向于使用“软件”、“互联网”、“半导体”等词汇。
当我们试图将这两个领域的文本进行区分时,如果关键词没有重叠,这一任务相对简单。
但如果存在重叠,我们需要转向分析词频,即这些关键词在各自文章中出现的频率。
这是因为,尽管金融文章可能偶尔提及计算机相关术语,其频率通常较低,反之亦然。
为了更直观地解释如何区分这两种文章,让我们简化模型,假设只有八个关键词:“金融”、“股票”、“交易”、“经济”、“计算机”、“软件”、“互联网”和“半导体”。
我们将这8个关键词进行词频统计,假设其中一个频次为(23,32,14,10,1,0,3,2),另一个(3,2,4,0,41,30,31,12),并将这两个各自形成一个八维向量,即v1和v2。
如果我们在八维空间中表示这些向量,会发现它们之间的夹角接近正交,说明不同领域文章的向量方向差异显著。
进一步假设另一篇文章的关键词频率向量V3(1,3,0,2,25,23,14,10)与计算机文章的向量夹角非常小,这表明这篇文章在主题上与计算机文章更为接近。
我们来看看计算原理:
=0.132,
所以:θ 约等于 82.4度。
同理 V2和V3的夹角最后为7.5度。
通过这种方式,我们可以利用向量之间的夹角来区分文章的领域归属。
此外,向量化的方法不仅适用于文章分类,也可用于人才筛选。
在招聘过程中,许多大型企业通过将简历转换为向量,并计算其与岗位要求向量之间的夹角,以自动筛选简历。
这种方法虽然有效率,但不免存在误筛的可能。
编写一份出色的简历的关键在于突出与岗位高度相关的技能和经验,避免过度泛化。
专注于岗位要求的关键维度可以显著提高简历通过自动筛选的几率。
一个精准定位的简历,其向量在关键维度上的分量显著,更容易与岗位要求的向量匹配,从而获得HR部门的青睐。
所以写简历要注意,假如你在简历里面写八个维度都是(10,10,10,10,10,10,10,10),那么可能和任何一个向量都不太接近,这样就导致人才筛选中把你直接“优化”掉!
比如说对开发人员的要求主要是六个方面,权重如下:
这样每个职位都对应一个N维的向量,我们假设是V。
接下来计算机会对简历进行分析,把每一份简历变成一个N维的向量,我们假设是P。
然后我们就计算P和V的夹角,如果夹角非常小,那说明某一份简历和某一个岗位可能比较匹配。
这时简历才转到相应的HR部门,HR人员才开始看简历。
03 余弦定理的价值
余弦定理的概念虽然早在欧几里得的《几何原本》中有所体现,但直到15世纪,贾姆希德·阿尔卡西的工作才使其形成系统。
通过余弦定理,我们不仅可以解决古老的几何问题,还可以应用于现代的各种场景,比如向量夹角的计算。
当我们将目光转向如何应用余弦定理计算向量夹角时,我们发现它对于文本分类、简历筛选等现代问题的解决具有重要意义。
通过将文本或个人简历转换为向量,我们可以计算它们之间的夹角,从而判断文本的相似性或简历的匹配度。
这种方法的应用范围广泛,从自动文本分类到大公司的简历筛选过程,都体现了余弦定理的实用价值。
通过理解和应用这一数学原理,我们不仅能够更深刻地理解数学与现实世界的联系,还能在各种现实问题中找到创新的解决方案。
因此,余弦定理不仅是我们学习数学体系中的一个节点,更是连接理论与实践,过去与现在的桥梁。
通过探索其深层意义和应用,我们可以更好地理解数学的美妙和实用性,为解决现代社会的问题提供强有力的工具。
好,今天就先这样啦!
科学羊🐏 2024/03/05
祝幸福~
参考文献:
[1].《吴军数学通识讲义》
感恩遇见,喜欢的话点个【在看】👍,有你们的支持是我最大的动力!
往期推荐